\section{Получение оценок информационных характеристик источника}
Задан файл <<cp.html>>. $N = 24{\,}603$~--- длина файла, $n$~--- длина последовательности символов ($n = 1, 2, 3, 4$).
Возьмем в качестве алфавита значения однобайтового ASCII (256 символов).
Требуется найти:
\begin{itemize}
    \item{энтропию, приписывая нулевые вероятности блокам, которые отсутствуют в файле}
    \item{энтропию, приписывая вероятности равные $\frac1{N^n}$ блокам, которые отсутствуют в файле}
    \item{применить несколько известных архиваторов, и сравнить с полученной энтропией}
\end{itemize}

\subsection{Эмпирическое распределение}

Для подсчета распределения была написана программа. Получим энтропию:
\begin{center}
    \begin{tabular}{|c|c|c|}
        \hline
        $n$&$H_n(X)$ при $p = 0$&$H_n(X)$ при $p=\frac1{N^n}$ \\
        \hline
        1&5.229136688128091 &5.303727939360624 \\
        \hline
        2&4.348282167389544 &4.3494412277877545 \\
        \hline
        3&3.4782798575562293 &3.478292909497773\\
        \hline
        4&2.8022504342073757 &2.8022505765721135\\
        \hline
    \end{tabular}
\end{center}

\subsection{Тестирование архиваторов}
В следующей таблице приведены результаты тестирование нескольких известных архиваторов.
\begin{center}
    \begin{tabular}{|c|c|c|}
        \hline
        Архиватор&Размер файла в байтах&Количество затраченных бит на букву\\
        \hline
        zip&7975&2.5932\\
        \hline
        7z&7732&2.5142\\
        \hline
        gzip&7853&2.5535\\
        \hline
        bzip2&7629&2.4807\\
        \hline
    \end{tabular}
\end{center}

Размеры файлов получились немного меньше, чем энтропия.